OpenAI presenta su modelo de razonamiento más avanzado y se adelanta a la competencia
El nuevo modelo o3, presentado durante un evento transmitido en vivo el viernes, dedica más tiempo a calcular una respuesta antes de responder a las consultas de los usuarios, con el objetivo de resolver problemas complejos de múltiples pasos.
Por: Bloomberg | Publicado: Viernes 20 de diciembre de 2024 a las 16:02 hrs.
T+
T-
La compañía planea lanzar el modelo o3-mini a finales de enero y el modelo o3 poco después, dijo el CEO Sam Altman.
Compartir
OpenAI se está preparando para lanzar un nuevo modelo de inteligencia artificial que, según la compañía, es capaz de un razonamiento más avanzado y similar al humano que sus ofertas actuales, intensificando la competencia con rivales como Google de Alphabet Inc.
El nuevo modelo o3, presentado durante un evento transmitido en vivo el viernes, dedica más tiempo a calcular una respuesta antes de responder a las consultas de los usuarios, con el objetivo de resolver problemas complejos de múltiples pasos. La startup también introducirá una versión más pequeña del modelo llamada o3-mini.
Durante la transmisión, OpenAI compartió algunos detalles de cómo o3 supera a o1, el modelo de razonamiento que introdujo en septiembre, al responder preguntas complicadas relacionadas con temas como programación.
OpenAI también invitó a investigadores de seguridad a probar los modelos como parte de su proceso antes de lanzar nuevos software.
La compañía planea lanzar el modelo o3-mini a finales de enero y el modelo o3 poco después, según el CEO de OpenAI, Sam Altman, durante el evento.
La carrera de la IA
OpenAI inició una carrera en IA con el lanzamiento de ChatGPT hace dos años, un chatbot inicialmente impulsado por un modelo de lenguaje grande llamado GPT-3.5. Posteriormente, en 2023, lanzó GPT-4, que describió como más preciso, creativo y recientemente o1, su primer modelo de razonamiento.
Un portavoz explicó que OpenAI decidió no nombrar al nuevo modelo como o2 “por respeto” a la marca de telecomunicaciones británica que lleva ese nombre (The Information informó previamente sobre el nombre).
Otros desarrolladores líderes en IA también están creando tecnologías cada vez más avanzadas. A principios de este mes, Google presentó una nueva versión de su modelo insignia, Gemini, que, según indicó, es el doble de rápido que el modelo anterior y puede "pensar, recordar, planificar e incluso actuar en tu nombre".
En tanto, el CEO de Meta, Mark Zuckerberg, también insinuó recientemente planes para lanzar Llama 4 el próximo año.
Sin embargo, varias empresas líderes, incluidas OpenAI y Google, se enfrentan a rendimientos decrecientes en sus costosos esfuerzos por desarrollar modelos más nuevos, según ha informado anteriormente Bloomberg News. Esto se debe, en parte, al desafío de encontrar suficientes fuentes nuevas e inexploradas de datos de entrenamiento de alta calidad y creados por humanos. Para superar este obstáculo, las empresas están recurriendo a nuevas tácticas, como poner mayor énfasis en el denominado razonamiento.
Alineación deliberativa
Junto con las vistas previas de los modelos, OpenAI publicó una investigación que describe un nuevo enfoque que está utilizando para garantizar que sistemas como o1 y o3 hagan lo que deben y eviten, por ejemplo, ayudar a los usuarios a realizar actividades ilegales. Llamada “alineación deliberativa,” la técnica hace que los modelos sigan una serie de pasos relacionados con la seguridad mientras consideran cómo responder a la consulta de un usuario.
La alineación, como se llama a este problema, representa un desafío técnico para quienes desarrollan modelos de lenguaje grande, que normalmente se entrenan con enormes cantidades de datos de internet. El esfuerzo se complica por el hecho de que las éticas y valores de las personas varían, al igual que sus ideas sobre lo que la IA debería o no debería poder hacer.
El último anuncio de OpenAI culminó 12 días de eventos de productos transmitidos en vivo. La startup ha utilizado esta serie de lanzamientos para presentar una nueva opción de suscripción ChatGPT Pro más costosa y comenzar a implementar una herramienta de generación de videos con IA llamada Sora, entre otros nuevos productos.